本サービスは、クラウドからの、エージェント ベースのサーバー監視です。それぞれのサーバーに、軽量でインストールも容易なエージェントを、ダウンロード・設定してください。エージェントは、パフォーマンスメトリックを、Site24x7のデータコレクターに送信します。ユーザーは、ブラウザーでレポートを表示できます。
Site24x7では、プライマリ データセンター(PDC)と、ディザスターリカバリデータセンター(DRDC)2つが別の地点に設定され、データセンターの障害の時も、監視サービスを継続サポートできるようにしています。
PDCに問題があれば、まず、ハートビートチェックによる情報が、自動的にプライマリDRDCに送られます。これにより、断続的なネットワーク障害による誤報アラームを回避します。プライマリDRDCでの問題発生時は、セカンダリDRDCは監視の継続のため、ハートビート チェックの受信を続けます。サーバーが正常停止すると、エージェントはSite24x7に、サーバー停止を通知します。
エージェントをユーザー マシンにインストールすると、プライマリ データセンターへの通信が、一方向HTTPS接続で始まります。その際、ファイアウォールで開放すべきポートやドメインをご確認ください。 エージェントは通信に、おもに次の3つの手段を利用します。
エージェントの「ハートビート チェック」は、エージェントはそのステータス情報をプライマリ データセンターに送信します。サーバー稼働時間は、Site24x7が、サーバー内のエージェントより、ハートビートを受信してからの期間で算出します。ハートビート チェックが3分連続で実行されない場合、「可用性ウォッチャー」はユーザーに、ネットワーク通信エラーやシステム クラッシュの可能性をアラートします。
デフォルトでは、エージェントは、ユーザーに通信エラーをアラートする前に、7分の待ち時間を設けます。待ち時間は、設定ページより 管理 > サーバー監視 > 設定 と移動して、変更できます。詳細はこちら。
サーバー監視エージェントは1分間隔でデータを収集し、5分間隔でSite24x7データセンターに統合します。しきい値違反が発生すると、即座にデータセンターに通信を行い、ユーザーにアラートを行います。さらにこのポーリング間隔は1分、5分、10分、15分、30分、1時間、3時間、6時間、12時間、1日から選択できます。
ネットワーク障害が発生すると、データはサーバにzipファイルで保存されます。接続が回復すると、エージェントがSite24x7データセンターにバックログを送信し、通信障害中のロスデータを回復させます。
Site24x7は装置メッセージング システムで、監視するサーバーへのリアルタイムな通信を行います。DMS(dms.zoho.com)への通信は、30秒ごとに行われます。エージェントはユーザー起動アクションを実行します。これには、プロセスの開始と停止、サービスやプロセスの検出、エージェントのアップグレード、根本原因分析のほか、ポート、URL、ファイル、ディレクトリ、イベントログ・syslogチェックなどの設定が該当します。
障害レポートの前に、Site24x7は、「ネットワークサニティチェック(基礎動作確認)」をおこない、自分が属する内部ネットワークの可用性を調べます。これにより、ダウンしているのは監視対象そのものであり、自身の環境のネットワークではないことを確認します。詳細は、障害のシナリオとトラブルシュート手順を、参照ください。
それぞれのサーバーに、軽量でインストールも容易なエージェントを、ダウンロード・設定してください。それに伴い、エージェントのセキュリティ対策や、データ収集のしくみ、インストールの要件を一度ご確認ください。詳細は、 サーバー監視エージェントのしくみと、監視するサーバーへのリアルタイム通信の確保を参照ください。
サポートプラットフォームについてはこちらを参照してください。また、一括に100のサーバーにエージェントをインストールできる一括デプロイ機能も利用可能です。各プラットフォームで取得できるパフォーマンスメトリクスについてはこちらを参照してください。
Site24x7プラグインは、DB、アプリケーション、Webサーバー、キャッシュ、メッセージ ブローカーを監視し、データの追跡を行う、優れた手段です。 MySQL、Redis、MongoDB、nginx、HAProxy、ZooKeeper、WordPress、Apache、ゾンビ プロセスなど、60以上の標準プラグインに対応しています。さらに、あらゆるNagiosプラグインがSite24x7で実行可能であるため、オープンソース コミュニティ(英語)でその詳細を確認できます。Linuxの場合は、 PythonかShell、Windowsの場合は、VBScript、PowerShell、バッチ、 DLLによって、カスタム監視を自身で記載することも可能です。
全サーバーのダウンタイムのために詳細な根本原因分析レポートを受信し、単一ダッシュボードでサーバー環境全体を表示して、IT自動化ツールを用いて復旧措置を自動化します。